2024-06-01
r-requirements.txt y py-requirements.txt en el repositorio del curso.renv::restore() para instalar paquetes desde r-requirements.txt. Asegurarse de tener renv instalado. Además, instalar el kernel de R en Jupyter con IRkernel::installspec().pip install -r py-requirements.txt para instalar paquetes desde py-requirements.txt.jupyter lab en la terminal desde el entorno virtual.Concepto clave
Las series de tiempo son comunes en diversas disciplinas, incluyendo economía, finanzas, meteorología, ingeniería y ciencias sociales.
Formalmente \(Y_t : \{y_1, y_2, \dots , y_T\}\) donde conocemos los valores de la serie hasta \(T\).
El objetivo principal del análisis de series de tiempo es modelar la estructura temporal de los datos para entender su comportamiento y hacer pronósticos futuros, clave para una planificación eficaz y eficiente.
Según Hyndman y Athanasopoulos (2021) las condiciones para estudiar las series de tiempo con fines de pronóstico son:
Qué tanto entendemos los factores que mueven la serie
Cuánta información tenemos sobre la serie
Qué tanto se parece el futuro al pasado
Si los pronósticos pueden afectar aquello que intentamos pronosticar. (expectativas)
Aplicaciones prácticas en diversos campos:
inversiones a largo plazo hasta operación diaria (plantas eléctricas, call centers, inventarios). - Horizonte variable: de años a minutos, según el caso. - Clave para una planificación eficaz y eficiente. - La predictibilidad depende de: - Comprensión de factores causales. - Cantidad y calidad de datos disponibles. - Estabilidad (que el futuro se parezca al pasado). - Reflexividad (si el pronóstico influye en el sistema). :::
Concepto clave
La regresión es una herramienta estadística utilizada para modelar y analizar la relación entre una variable dependiente y una o más variables independientes.
La regresión es una herramienta que permite estimar la media condicional a una o más variables de una variable dependiente (\(Y\)) dado un conjunto de otras variables llamadas regresoras, variables condicionales o covariables (\(X\)).
Tenemos \(n\) obervaciones de una variable de interés \(Y\) y un set de \(k\) covariables \(X_{1}, X_{2}, ..., X_{k}\). El modelo lineal para \(Y\) será:
\[ E(Y|\mathbf{X}) = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \dots + \beta_k X_k + \varepsilon \]
Donde:
Si tanto \(Y\) como \(X\) son continuos \[\beta_k = \frac{\Delta Y}{\Delta X_k}\] \(\beta_k\) = El cambio promedio esperado en \(Y\) ante un cambio en \(X\)
Si \(Y\) es númerica y \(X\) es dicotómica \[\beta_k = E(Y|X = 1) - E(Y|X = 0)\] \(\beta_K\) = Es la diferencia promedio esperada en \(Y\) cuando \(X = 1\) respecto a \(X = 0\)
UTB-ETD | Programa de Ciencia de Datos